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摘 要 类 言语 发 声 是 类 似 成 人 言语 的 语音 ,， 是 后 续 语言 发 展 的 基础 。 已 有 研究 表明 ， 婴 幼儿 类 言语 发 声 数 
量 或 频次 、 典 范 音节 比例 或 频次 、 辅 音 多 样 性 与 沟通 性 发 声 预测 了 表达 性 语言 ， 但 对 理解 性 语言 的 预测 结果 
不 一 致 ， 典 范 呀 呀 语 起 始 年 龄 对 表达 性 词语 起 始 年 龄 和 表达 性 词汇 量 预测 的 结果 不 一 致 。 类 言语 发 声 对 语言 
发 展 的 预测 在 一 定 程度 上 可 以 由 类 言语 发 声 提 供 了 语言 产生 的 基础 、 创 造 了 婴 幼 儿 的 学 习 状 态 和 诱发 了 社会 
性 回应 行为 三 个 方面 解释 。 未 来 研究 可 考虑 探索 类 言语 发 声 与 语言 发 展 的 因果 关系 、 相 关 因 素 对 类 言语 发 声 
预测 语言 发 展 的 调节 效应 、 语 言 测 试 方式 及 类 言语 发 声 指标 本 身 的 影响 、 语 言 障 碍 儿童 语言 干预 中 最 具有 价 
值 的 类 言语 发 声 和 类 言语 发 声 与 社会 回应 的 动态 交互 。 

关键 词 。 婴 幼儿 ， 类 言语 发 声 ， 语言 发 展 ,语言 障碍 
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1 引言 是 由 辅音 (Consonant，C) 和 元 音 (Vowel，V) 的 组 合 
音节 构成 ,两 者 的 区 别 : 一 是 典范 呀 呀 语 的 C 和 
V 之 间 过 湾 快 速 (通常 小 于 120 ms， 也 有 研究 认为 
小 于 250 ms), 边缘 呀 呀 语 的 C 和 V 过 渡 时 间 通 常 
大 于 120 ms (也 有 研究 认为 大 于 250 ms); 二 是 边 
缘 呀 呀 语 可 能 没有 完全 元 音 作 为 音节 核 (nucleus) 
且 可 能 没有 实质 性 的 C 和 V 的 过 渡 , 而 典范 呀 呀 
语 必须 有 一 个 完全 元 音 作 为 音节 核 且 有 实质 性 的 
C 和 V 的 过 渡 (Buder et al., 2013; Goldstein & 
Schwade, 2008)。 

类 言语 发 声 作为 言语 发 展 的 前 体 (precursor) 
占据 了 婴儿 发 声 的 主体 (Oller et al., 2021), 其 对 
语言 能 力 的 预测 在 TD 儿童 和 相关 语言 障碍 儿童 
中 得 到 了 广泛 研究 。 然 而 ， 这些 研究 主要 为 相关 
研究 ， 尚 缺乏 因果 关系 的 研究 ， 且 研究 结果 不 一 
致 。 例 如 ， 有 研究 表明 类 言语 发 声 起 始 年 龄 预测 
表达 性 词语 起 始 年 龄 (McGillion et al., 2017), A 
人 研究 却 未 发 现 两 者 间 的 预测 关系 (Lang et al., 
2021)。 另 有 研究 发 现 类 言语 发 声 数 量 预测 婴 幼 儿 
收 稿 日 期 : 2022-10-18 的 理解 性 语言 (Weismer et al., 2010)， 有 研究 则 未 
* 国家 重点 研发 计划 资助 (2022YFC2705201)， 上 海 市 发 现 这 种 关系 (Werwach et al., 2021). IPA, 4 

浦江 作 才 计划 项 目 (2019PJC033), 上 海 市 长 人 区 了 生 。 | 的 哪些 类 言语 发 声 与 其 语言 发 展 存在 相关 ? 这 


类 言语 发 声 (speech-like vocalizations) 也 称 原 
音 (protophone)， 指 婴 幼 儿 在 主要 使 用 口语 沟通 之 
前 发 出 的 , 不 同类 型 的 沿 着 一 个 连续 体 发 展 并 逐 
渐变 得 更 像 言语 的 声音 (Oller 2000; Schoen 
Simmons, 2021)。 发 育 正常 (Typical Development, 
TD) 儿 童 的 类 言语 发 声 是 从 准 元 音 (quasivowels) 
(0~2 个 月 )， 咕 咕 声 (goos) (1~4 A), 完全 元 音 
(full vowels 或 fully resonant nuclei) 和 边缘 呀 呀 语 
(marginal babbling) (3~8 个 月 ), 发 展 到 典范 呀 呀 
语 (也 称 规范 呀 呀 语 ) (canonical babbling) (5~10 个 
H) (Morgan & Wren, 2018; Oller, 2000)。 准 元 音 发 
声 时 声 道 处 于 较 自 然 的 状态 ， 尚 未 形成 元 音 的 声 
道 形 状 ， 听 起 来 声音 更 轻 且 时 间 更 短 ; 完全 元 音 
发 声 时 已 形成 元 音 的 声 道 形 状 ， 听 起 来 声音 更 大 
且 时 间 更 长 ; 咕 吐 声 是 舌头 靠近 口腔 后 部 时 的 发 
(Buder et al., 2013)。 典 范 呀 呀 语 和 边缘 呀 呀 语 


健康 委员 会 项 目 (2019CNECNUPI05-1)， 国 家 语 委 项 
习 (YB145-21)。 种 相关 的 机 制 是 什么 ?本文 首先 回顾 了 婴 幼 儿 类 
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其 次 总 结 可 以 解释 两 者 相关 的 内 在 机 制 ， 最 后 对 
未 来 研究 提出 展望 。 文 章 期 望 通过 对 已 有 文献 的 
梳理 和 总 结 , 进一步 理解 婴 幼儿 的 类 言语 发 声 如 
何 帮助 其 从 前 语言 期 过 渡 到 语言 期 ， 从 而 为 如 何 
更 好 地 促进 婴 幼儿 语言 发 展 提供 科学 依据 。 


2 婴 幼儿 类 言语 发 声 指标 及 其 对 语言 
发 展 的 预测 
21 婴 幼儿 类 言语 发 声 指标 


研究 采用 更 具体 的 指标 探究 类 言语 发 声 对 语 
言 能 力 的 预测 作用 。 主 要 指标 有 3 个 : 一 是 发 声 
的 数量 (quantity of vocalizations)， 即 样本 中 类 言 
语 发 声 的 总 数量 或 总 频次 ; 二 是 发 声 的 语音 质 
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表 1 
指标 
发 声 的 总 数量 (number of total vocalizations) 


非典 范 音节 的 频次 

(frequency of noncanonical syllables) 
典范 音节 的 频次 

(frequency of canonical syllables) 


发 声 的 数量 
发 声 的 语音 


质量 


典范 音节 比例 (proportion of vocalizations with 
a canonical syllable) 或 典范 呀 呀 语 比 率 
(canonical babbling ratio，CBR)， 其 包括 五 个 
不 同 的 指标 : CBRIt，CBRSI，CBROTITER， 
TCBR", TCBR™! 


= 


HE 范 呀 呀 语 起 始 年 龄 
(canonical babbling onset, CBO) 


半音 类 型 数 (consonant inventory) 


沟通 辅音 多 样 性 (diversity of key consonants 
used in communication acts, DKCC) 
发 声 的 沟通 
质量 


发 声 沟通 行为 数量 (number of communication 
acts with a vocalization) 
沟通 性 发 声 比 例 


(proportion of communicative vocalizations) 
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(phonological quality of vocalizations), BIA 74 
是 否 包 含 典范 音节 或 辅音 ， 如 典范 音节 比例 、 沟 
通 辅音 多 样 性 ; 三 是 发 声 的 沟通 质量 (communicative 
quality of vocalizations)， 即 发 声 是 否 指向 他 人 ， 
具有 明确 的 沟通 意图 (McDaniel et al., 2020a)。 研 
究 者 指出 , 虽然 沟通 辅音 多 样 性 是 指 沟通 行为 中 
的 不 同 辅音 类 型 , 但 其 在 概念 上 更 多 与 语音 的 复 
杂 性 有 关 (McDaniel et al., 2020b)。 表 1 总 结 了 研 
究 中 预测 语言 能 力 的 主要 类 言语 发 声 指 标 及 定义 
(如 Brookman et al., 2020; Fagan, 2009; Gerhold et 
al., 2020; Lang et al., 2021; Lopez et al., 2020; 
McDaniel & Schuele, 2021; McDaniel et al., 2020a, 
2020b; McGillion et al., 2017)。 


预测 语言 能 力 的 主要 类 言语 发 声 指标 及 定义 


定义 
发 声 样本 中 的 类 言语 发 声 的 总 数量 或 总 频次 
不 包含 典范 音节 的 发 声 ， 如 完全 元 音 、 边 缘 呀 呀 语 等 发 声 频次 


由 结构 良好 的 、 类 似 
声 的 频次 

CBR" 是 指 典 范 音节 数量 /话语 总 数量 (number of canonical 
syllables/total number of utterances)， 其 中 话语 是 指 一 个 “呼吸 
组 ”(breath group) 内 的 一 个 发 声 或 一 组 发 志 , 由 可 听见 的 呼吸 
或 1 秒 及 以 上 停顿 分 开 
CBR”! 是 指 典范 音节 数量 /音节 总 数量 (number of canonical 
syllables/total number of syllables) 

CBRUTTER 是 指 包含 典范 音节 的 话语 数量 /话语 总 数量 (number 
of utterances containing canonical syllables/total number of 
utterances) 


TCBR 是 指 真 典 范 音节 数量 /话语 总 数量 (number of true 
canonical syllables/total number of utterances), 其 中 真 典 范 音节 
是 指 排除 了 包含 声 门 辅音 (glottal consonants) 和 滑 音 (glides) 的 
典范 音节 

TCBRsy 是 指 真 典范 音节 数量 /音节 总 数量 (number of true 
canonical syllables/total number of syllables) 

婴儿 的 典范 音节 比率 达到 0.15 或 0.2 时 的 年 龄 , 或 在 一 个 呼吸 
周期 中 婴儿 结合 多 个 发 音 动 作 发 出 至 少 2 个 发 声 
(multisyllabicity，MULTD 并 在 接 下 来 两 个 月 维持 的 年 龄 ， 或 重 
fF i (reduplicated babbling) 产 生 的 年 龄 ， 或 一 个 /两 个 声 门 
上 辅音 (supraglottal consonants) 稳 定 产生 的 年 龄 

发 声 样本 中 的 辅音 类 型 数量 


沟通 发 声 行为 中 的 不 同 辅音 , 主要 为 在 婴儿 早期 发 展 出 的 13 个 辅 
音 ， 即 /my, /n/, /b/ 或 /p/, 1d/ 或 1, /g/ 或 /kK/, /w/, IV, “7”, /s/, “sh” 


儿童 所 有 沟通 行为 中 伴 有 发 声 的 沟通 行为 数量 


然 言 语 中 的 C 和 V 组 合 的 


I 范 音 节 发 


沟通 性 发 声 数 量 占 总 发 声 数 量 的 百分比 
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22 ” 婴 幼儿 类 言语 发 声 的 数量 对 语言 发 展 的 预测 
各 人 研究 对 语言 能 力 测量 的 方法 不 尽 相 同 , 例 
如 , Yankowitz 等 人 (2022) 采 用 Mullen 早期 学 习 量 
表 (Mullen Scales of Early Learning, MSEL) 测 量 了 
词语 、 语 法 等 综合 表达 性 语言 Woynaroski 等 人 
(2017) 采 用 麦克 阿 瑟 - 贝 茨 沟通 发 展 量 表 (MacArthur- 
Bates Communicative Development Inventory, 
MCDD 测 量 了 儿童 的 表达 性 词汇 量 。 因 此 ， 本 文 
用 “理解 性 语言 或 表达 性 语言 " 指 代 量 表 得 出 的 综 


总 的 来 说 ， 类 言语 发 声 数量 预测 表达 性 语言 
的 结果 相对 一 致 ， 而 对 理解 性 语言 预测 的 结果 存 
在 差异 。 这 种 不 一 致 可 能 是 语言 能 力 的 测试 方式 
不 同 以 及 理解 性 和 表达 性 语言 的 不 同 特征 导致 
的 。 例 如 Nevill 等 人 (2019) 在 总 结 以 往 语言 测量 
结果 差异 时 发 现 ， 直 接 向 儿童 测试 的 结果 为 表达 
性 语言 高 于 理解 性 语言 ， 而 间接 测试 (如 父母 报告 ) 
出 现 理解 性 语言 高 于 表达 性 语言 的 截然 相反 的 结 
果 。 他 们 的 研究 还 发 现 不 同 的 直接 施 测 的 量 表 测 


合 语言 能 力 或 多 个 量 表 得 分 整合 的 语言 能 力 ,用 


得 的 语言 能 力 之 间 也 出 现 类 似 的 结果 。 理 解 性 语 


“表达 性 词汇 量 ” 指 代 以 具体 词汇 量 为 结果 的 语言 
能 力 。 

婴 幼 儿 的 类 言语 发 声 数量 能 较 有 效 地 预测 表 
达 性 语言 , 但 对 是 否 能 预测 理解 性 语言 的 结果 不 
一 致 。 测 量 婴 幼儿 类 言语 发 声 数 量 的 方法 主要 有 
3 种 : 一 是 自动 化 软件 “语言 环境 分 析 ”(Language 
ENvironment Analysis, LENA) (如 Brookman et al., 
2020), 二 是 游戏 互动 样本 分 析 ( 如 Lyakso et al., 
2014)， 三 是 父母 报告 (Werwach et al., 2021)。 关 于 
全 天 语言 样本 LENA 的 元 分 析 研 究 综合 分 析 了 早 
产 1 个 月 的 婴儿 到 46 个 月 的 TD 幼儿 、 听 障 
(hearing loss) 幼 儿 和 孤独 症 谱系 障碍 (Autism 
Spectrum Disorder，ASD) 幼 儿 的 类 言语 发 声 数 量 
与 表达 性 语言 或 理解 性 语言 的 关系 ,结果 表明 类 
言语 发 声 数量 与 语言 能 力 (包括 理解 和 表达 ) 相 关 
(Wang et al., 2020)。 随 后 两 项 同样 采用 LENA 测 
量 TD 婴儿 发 声 数量 的 研究 支持 上 述 元 分 析 的 结 
果 ， 婴 儿 12~14 个 月 时 的 发 声 数量 预测 18~20 个 
月 时 的 表达 性 词汇 量 (Brookman et al., 2020; Ha et 
al., 2022)。 游 戏 互动 样本 分 析 研 究 表明 , 9 个 月 TD 
婴儿 的 类 言语 发 声 数 量 与 12 和 24 个 月 时 的 表达 
性 词汇 量 相关 (Lyakso et al., 2014), 平均 年 龄 23 
和 33 个 月 的 ASD 幼儿 的 类 言语 发 声 频次 预测 1 
年 后 或 当下 的 表达 性 语言 (McDaniel et al., 2020a; 
evill et al, 2019), 但 没 能 预测 理解 性 语言 
Nevill et al., 2019)。 另 一 项 关于 30 个 月 大 ASD 
WA IB (developmental delay) 幼 儿 的 研究 发 现 ， 
ASD 幼儿 的 发 声 频次 与 当下 的 理解 性 和 表达 性 语 
言 相 关 ， 而 发 育 迟 缓 幼儿 没有 表现 出 相同 的 趋势 
(Weismer et al., 2010)。 父 母 报告 分 析 结 果 显 示 , 6 
个 月 TD 婴儿 的 类 言语 发 声 数量 对 12 个 月 时 的 表 
达 性 词汇 量 有 显著 预测 作用 ， 对 理解 性 词汇 量 则 
无 显著 预测 作用 (Werwach et al., 2021)。 
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言 能 力 比 较 内 隐 ， 难 以 通过 测试 全 面 反映 出 来 ; 
而 表达 性 语言 比较 外 显 ， 较 容易 通过 测试 反映 出 
来 。 未 来 可 开展 相关 研究 ， 以 确定 语言 测试 方式 
的 影响 作用 。 
2.3 ” 婴 幼 儿 发 声 的 语音 质量 对 语言 发 展 的 预测 
2.3.1 ” 婴 幼 儿 上 典范 与 非典 范 音节 频次 或 比例 对 语 
言 发 展 的 预测 
典范 音节 频次 或 比例 对 婴 幼 儿 的 表达 性 语言 
有 较 好 的 预测 作用 , 非典 范 音 节 频 次 未 能 预测 表 
达 性 和 理解 性 语言 。TD 儿童 的 研究 表明 , 9 和 12 
个 月 婴儿 的 典范 音节 比例 或 真 典 范 音节 比例 预测 
了 21 和 24 个 月 时 的 表达 性 词汇 量 (Chapman et al., 
2003; Yankowitz et al., 2022)。 然 而 , 6~8 个 月 婴儿 
由 范 音 节 比 例 对 表达 性 词汇 量 的 预测 不 一 致 ， 
Yankowitz 等 人 (2022) 研 究 中 6 个 月 婴儿 的 典范 音 
节 比 例 未 能 预测 24 个 月 时 表达 性 词汇 量 ， 另 一 项 
研究 发 现 6~8 个 月 婴儿 典范 音节 比例 预测 了 
18~20 个 月 时 的 表达 性 词汇 量 (Kim & Ha, 2022)。 
其 原因 可 能 是 婴儿 的 年 龄 差异 , Yankowitz 等 人 研 
究 中 只 包括 6 个 月 大 的 婴儿 , 年 龄 太 小 导致 典范 
音节 比例 太 低 (平均 2% 左 右 ); Kim 和 Ha 研究 中 纳 
入 8 月 龄 的 婴儿 ， 典范 音节 比例 稍 高 (平均 15% 左 
F). 关于 非典 范 音 节 数 量 与 语言 能 力 关 系 的 研究 表 
明 , 13 个 月 婴儿 的 非典 范 音 节 与 表达 性 词汇 量 和 理 
解 性 词汇 量 均 不 相关 (Lopez et al., 2020); 该 研究 
还 发 现 典范 音节 数量 与 理解 性 词汇 量 也 不 相关 。 
语言 障碍 儿童 的 研究 也 发 现 类 似 的 结果 。 例 
w, 9 个 月 ASD 婴儿 每 分 钟 产生 的 典范 音节 数量 
与 12 个 月 时 的 表达 性 语言 存在 相关 ， 非 典范 音节 
数量 与 表达 性 语言 不 相关 (Talbott，2014)。9 个 月 
时 使 用 典范 音节 比 未 使 用 典范 音节 的 脆性 六 综合 
征 (fragile X syndrome) 婴 儿 在 24 个 月 时 有 更 好 的 
表达 性 语言 和 理解 性 语言 ， 且 早期 典范 音节 比例 
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更 高 的 后 期 表达 性 语言 更 好 (Hamrick et al., 2019), 
婴儿 早期 缺乏 典范 音节 可 能 预示 着 后 期 的 语言 发 
育 迟 缓 (Lohmander et al., 2017; Rubin, 2021), 整体 
上 来 说 , 典范 音节 频次 或 比例 预测 了 表达 性 语言 ， 
只 有 少量 研究 涉及 典范 音节 频次 对 理解 性 语言 的 
预测 且 结 果 不 一 致 。 此 外 , 年龄 可 能 是 影响 典范 
音节 对 表达 性 语言 预测 的 因素 。 
2.3.2” 婴 幼儿 典范 呀 呀 语 起 始 年 龄 对 语言 发 展 的 
预测 

婴 幼 儿 典 范 呀 呀 语 起 始 年 龄 对 表达 性 词语 起 
始 年 龄 和 表达 性 词汇 量 预测 的 结果 不 一 致 。 首 先 ， 
有 研究 采用 至 少 一 个 或 两 个 声 门 上 辅音 稳定 产生 
作为 典范 呀 呀 语 起 始 年 龄 (CBO) 的 标准 ， 并 探讨 
CBO 是 否 能 预测 第 一 批 有 意义 表达 性 词语 起 始 年 
龄 (the age of word onset) 或 理解 性 与 表达 性 词汇 
量 ( 如 Majorano et al., 2014; McGillion et al., 
2017)。CBO 与 有 意义 表达 性 词语 起 始 年 龄 相关 ， 
即 CBO 越 小 有 意义 表达 性 词语 起 始 年 龄 越 小 
(Keren-Portnoy et al., 2009; McGillion et al., 
2017)。 然 而 , CBO 对 理解 性 和 表达 性 词汇 量 的 预 
测 不 一 致 。Majorano 等 人 (2014) 发 现 CBO 预测 婴 
JL 12 个 月 时 表达 性 词汇 量 ( 即 CBO 越 小 12 个 月 
时 词汇 量 越 大 ), 但 未 能 预测 12 个 月 时 的 理解 性 
词汇 量 和 18 个 月 时 的 表达 性 词汇 量 ; McGillion 等 
人 (2017) 发 现 CBO 未 能 预测 婴儿 18 个 月 时 的 理 
解 性 词汇 量 , 但 预测 表达 性 词汇 量 。 

其 次 ,是 否 包含 两 个 重 苹 呀 呀 语 或 典范 呀 呀 
语 比率 或 MULTI 是 确定 CBO 的 另 一 些 常 用 指标 。 
使 用 这 几 个 指标 的 研究 显示 ，CBO 与 有 意义 表达 
性 词语 起 始 年 龄 之 间 不 相关 (Fagan，2009; Lang 
et al., 2021), CBO 与 有 意义 表达 性 词语 起 始 年 龄 
之 间 年 龄 差 的 变异 很 大 ， 时 间 间 隔 在 2~11 个 月 
(Lang et al., 2021)。 然 而 , Jung 和 Houston (2020) 
对 平均 开机 年 龄 为 21 个 月 的 人 工 耳 蜗 植 人 幼儿 
以 典范 呀 呀 语 比 率 为 指标 的 CBO 与 语言 能 力 进 
行 关 系 探讨 后 发 现 ，CBO 预测 幼儿 人 工 耳 蜗 开 机 
后 24 个 月 时 的 表达 性 词汇 量 。 
由 此 可 见 ， 现 有 的 研究 并 不 能 得 出 呀 呀 语 发 
声 越 早 表达 性 语言 越 好 的 结果 。 原 因 之 一 可 能 是 
采用 的 指标 不 同 ， 导 致 CBO 在 各 研究 间 有 较 大 差 
异 。 比 如 , McGillion 等 人 (2017) 研 究 中 连续 两 个 声 
门 上 辅音 稳定 产生 为 标准 的 婴儿 CBO 中 位 年 龄 
为 10 个 月 , Lang 等 人 (2021) 研 究 中 以 典范 呀 呀 语 


比率 和 MULTI 等 6 个 指标 为 标准 的 CBO 最 大 平 
均 年 龄 8 个 月 ,不 同 的 CBO 可 能 代表 婴儿 不 同 的 
能 力 基础 。 虽 然 CBO 捕捉 到 婴儿 在 产生 单词 时 的 
口语 运动 准备 状态 的 出 现 (Oller 2000), 但 对 于 许 
多 婴儿 来 说 9 个 月 及 以 下 的 时 间 点 还 是 太 早 且 不 
足以 表明 更 高 程度 的 口语 运动 能 力 (Lang et al., 
2021)。 然而 达到 连续 两 个 不 同 辅音 产生 标准 的 婴 
儿 也 许 有 更 好 的 口语 运动 能 力 ， 能 够 集中 注意 力 
并 记 住 词语 的 形式 及 含义 (McCune & Vihman, 
2001)， 这 在 一 定 程 度 上 解释 了 以 不 同 辅音 稳定 F 
EX CBO 标准 的 研究 有 更 多 积极 的 结果 。 另 外 ， 
有 意义 词语 产生 及 发 展 的 前 提 条 件 可 能 超越 了 单 
纯 的 语音 能 力 。 婴 儿 的 认 知 、 沟 通 等 技能 可 能 
助 于 婴儿 习 得 词语 ,这 些 技能 的 不 同步 发 展 可 能 会 
影响 有 意义 表达 性 词语 起 始 年 龄 (Lang et al., 2021). 
结合 上 述 结 果 及 分 析 ， 对 于 典范 呀 呀 语 起 始 年 龄 
及 其 与 后 期 表达 性 词汇 关系 的 探究 ， 需 要 综合 考 
虑 沟通 、 认 知 等 因素 和 CBO 不 同 指标 的 影 
233 BOILER SHENAE 
辅音 多 样 性 是 指 辅音 类 型 数 和 沟通 辅音 多 样 
性 。 关 于 辅音 类 型 数 对 语言 能 力 预测 的 研究 发 现 ， 
TD 婴儿 11 个 月 时 的 辅音 类 型 数 预测 24 个 月 时 平 
均 句 长 (Mean Length of Utterance in Morphemes, 
MLU) 和 自发 语言 样本 中 的 词汇 多 样 性 (vocabulary 
diversity in spontaneous language samples), 但 未 
预测 MCDI 中 的 表达 性 词汇 量 ; 18 个 月 时 的 辅音 
类 型 数 预测 24 个 月 时 的 MLU、 词 汇 多 样 性 和 表 
达 性 词汇 量 ， 且 18 个 月 时 辅音 类 型 数 引 起 的 变异 
量 大 于 11 个 月 时 ; 但 7 个 月 时 的 辅音 类 型 数 未 能 
预测 24 个 月 时 的 MLU、 词 汇 多 样 性 和 表达 性 词 
汇 量 (Gerhold et al., 2020)。 研 究 者 认为 可 能 是 由 
于 7 个 月 婴儿 年 龄 太 小 ， 其 辅音 类 型 数 还 不 足以 
预测 随后 的 表达 性 语言 。 随 后 关于 TD 和 6 个 月 
前 佩戴 助听器 的 中 轻 度 听 障 婴儿 的 研究 显示 ，18 
个 月 时 的 辅音 类 型 数 与 24 个 月 时 的 表达 性 词汇 
量 相关 (Persson et al., 2022), S (cleft palate) JL 
童 在 手术 修复 前 9 个 月 时 的 辅音 类 型 数 与 39 个 月 
时 儿童 能 使 用 的 不 同 词语 的 数量 呈 负 相关 ， 在 手 
术 后 21 个 时 月 两 者 呈正 相关 ， 研 究 者 认为 术 前 的 
结果 可 能 并 不 能 代表 真实 的 结果 ; 此 外 ，21 个 月 
时 的 辅音 类 型 数 与 39 个 月 时 的 MLU 呈 负 相关 
(Beckett,，2017)。 由 辅音 类 型 数 对 MLU 预测 的 截 
然 相 反 的 结果 推断 ， 该 指标 可 能 并 不 是 一 个 很 好 
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能 预测 MLU 的 指标 。 

目前 有 更 多 研究 开始 采用 沟通 行为 中 辅音 多 
样 性 作为 指标 探究 其 与 语言 的 关系 ， 且 相关 研究 
主要 集中 在 ASD 儿童 和 TD 儿童 中 。 关 于 TD 幼 
儿 的 研究 发 现 ，20 个 月 时 的 沟通 辅音 多 样 性 预测 
33 个 月 时 的 表达 性 语言 , 但 未 预测 理解 性 语言 能 
力 ; 14 个 月 时 的 沟通 辅音 多 样 性 未 能 预测 后 期 理 
解 性 和 表达 性 语言 (Watt et al., 2006)。 结合 上 文 关 


性 词汇 越 多 ， 即 有 意图 的 发 声 沟 通行 为 预测 了 表 
达 性 词汇 量 。 因 此 , 研究 者 认为 婴儿 后 期 语言 最 
有 价值 的 预测 指标 是 早期 表现 出 的 协调 注视 的 沟 
通 性 发 声 的 频次 。 

沟通 性 发 声 对 表达 性 语言 的 预测 也 在 ASD 
儿童 中 得 到 验证 。McDaniel 等 人 (2019) 对 平均 年 
龄 为 35 个 月 的 无 口语 或 表达 性 词汇 低 于 20 个 的 
ASD 儿童 进行 研究 ,发 现 ASD 幼儿 的 沟通 性 发 声 


于 辅音 类 型 数 的 研究 结果 ， 大 约 在 18 个 月 时 辅音 
多 样 性 对 表达 性 语言 的 预测 作用 变 得 更 明显 。 关 
于 ASD 儿童 的 研究 表明 , 平均 年 龄 为 21 个 月 的 
ASD 儿童 的 沟通 辅音 多 样 性 预测 3 岁 时 的 表达 性 
语言 (Wetherby et al., 2007)。 随 后 的 关于 ASD 幼 
儿 、 脆 性 XX 综合 征 幼儿 的 研究 也 得 出 相同 的 结 
(Fielding-Gebhardt & Warren, 2019; McDaniel 
et al., 2020a; Saul & Norbury, 2020; Woynaroski et 
al., 2017; Yoder et al., 2015)。 由 此 可 见 ,， 大量 研 究 
表明 辅音 多 样 性 预测 表达 性 语言 。 研 究 结果 在 一 
定 程度 上 支持 了 辅音 的 产生 可 能 与 口语 共享 运动 
能 且 可 能 表明 儿童 在 尝试 说 出 词语 (Woynaroski 
et al., 2016). 

综合 已 有 关于 婴 幼 儿 类 言语 发 声 的 语音 质量 
对 语言 发 展 预测 的 研究 ,不 难 发 现 婴 幼儿 典范 音 
节 频 次 或 比例 与 辅音 多 样 性 对 语言 能 力 的 预测 ， 
尤其 是 表达 性 语言 的 预测 结果 相对 一 致 ， 但 年 龄 
可 能 是 一 个 影响 预测 作用 的 调节 因素 ; 典范 呀 呀 


数量 能 有 效 预测 4、8 和 12 个 月 后 的 表达 性 语言 。 
随后 的 研究 也 支持 这 一 结果 , 平均 年 龄 为 23 个 月 
的 ASD 儿童 在 半 结 构 化 游戏 互动 中 的 发 声 沟通 
行为 数量 和 沟通 性 发 声 比 例 有 效 预测 12 个 月 后 
的 表达 性 语言 (McDaniel et al., 2020a)。 然 而 ， 这 些 
研究 并 未 具体 分 析 不 同 的 发 声 沟 通行 为 ( 即 发 声 
与 眼神 协调 、 发 声 与 手势 协调 、 发 声 与 眼神 和 手 
势 协 调 )， 那么 就 不 能 确定 到 底 是 哪 种 类 型 的 发 声 
沟通 行为 对 ASD 儿童 表达 性 语言 有 预测 作用 。 
ASD 儿童 的 眼神 接触 存在 障碍 (Bradshaw et al., 
2021), 我 们 有 理由 推 岂 ASD 儿童 的 发 声 与 眼神 
协调 的 沟通 行为 会 更 少 。 最 新 的 研究 也 证 实 , 词 
汇 量 低 于 20 个 的 ASD 儿童 的 发 声 和 眼神 协调 、 
发 声 协调 眼神 与 手势 的 沟通 行为 均 少 于 词汇 量 相 
“iy TD 儿童 , 但 发 声 与 手势 协调 的 沟通 行为 与 
TD 儿童 无 明显 差异 (Murillo et al., 2021)。 由 此 可 
JIL, ASD 儿童 具体 的 发 声 沟通 行为 对 表达 性 语言 
的 预测 可 能 与 TD 儿童 有 所 不 同 , 有 必要 对 此 进 


语 起 始 年 龄 对 语言 能 力 的 预测 结果 差异 较 大 ,可 
能 受 其 他 因素 的 影响 。 

24 婴 幼儿 发 声 的 沟通 质量 对 语言 发 展 的 预测 
词语 学 习 的 社会 语 用 理论 (social pragmatic 
theory) 认 为 ， 有 意识 的 前 语言 沟通 是 主体 间 共 享 


a 


行 深 入 研究 。 

综 上 所 述 , 沟通 性 发 声 是 后 期 表达 性 语言 有 
效 的 预测 指标 相 比 较 非典 范 音节 沟通 性 发 声 ， 
息 范 音节 沟通 性 发 声 对 表达 性 语言 的 预测 效力 可 
能 更 强 。 此 外 , 沟通 性 发 声 对 TD 儿童 和 语言 发 展 


= 


符号 使 用 的 先决 条 件 (Tomasello, 2008). 发声 沟 通 
行为 是 指 发 声 与 眼神 或 手势 相 结合 的 、 有 明确 指 
向 沟通 对 象 的 行为 (McDaniel et al., 2020a, 
2020b)。 对 TD 儿童 和 语言 发 展 障碍 儿童 的 研究 表 
明 ， 有 意图 的 沟通 性 发 声 能 有 效 预测 词汇 发 展 。 
Donnellan 等 人 (2020) 探 究 11~12 个 月 婴儿 在 自然 
情境 下 母 婴 互动 中 的 发 声 频次 与 15~24 个 月 (平均 
19 个 月 ) 时 的 表达 性 词汇 之 间 的 关系 。 结 果 发 现 ， 
当 不 考虑 发 声 是 否 与 眼神 协调 时 ， 典 范 音节 发 声 
越 多 表达 性 词汇 越 多 ， 而 非典 范 音节 发 声 越 多 表 
达 性 词汇 越 少 ， 当 发 声 与 眼神 相 协 调 时 ,发声 总 
数量 (包括 典范 音节 和 非典 范 音节 发 声 ) 越 多 表达 


障碍 儿童 的 表达 性 语言 均 有 预测 作用 。 然 而 , K 
于 哪些 发 声 沟通 行为 对 特定 类 型 的 语言 障碍 儿童 
表达 性 语言 发 展 有 预测 作用 尚 需 进 一 步 探究 。 


3 ”类 言语 发 声 有 利于 语言 发 展 的 机 制 


早期 研究 证 明 语言 产生 的 一 个 先决 条 件 是 特 
定 运动 技能 的 发 展 ， 如 产生 音节 的 能 力 (Vihman 
et al.，1985)。 近 期 的 研究 揭示 婴 幼 儿 类 言语 发 声 
和 社会 回应 的 交互 模式 也 为 语言 发 展 提供 可 能 3 
源 。 下 文 将 探讨 类 言语 发 声 有 助 于 语言 发 展 的 三 
种 可 能 机 制 : 发 声 提供 了 语言 产生 的 基础 、 发 声 
创造 了 有 效 的 学 习 状态 和 发 声 诱发 了 社会 的 回应 
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行为 。 类 言语 发 声 已 表现 出 功能 灵活 性 ， 即 婴儿 在 不 同 


3.1 ”类 言语 发 声 提供 了 语言 产生 的 基础 

第 一 种 机 制 强调 类 言语 发 声 的 语音 和 功能 特 
征 是 言语 产生 的 基础 。 通 常 存在 一 种 自然 的 逻辑 ， 
即 发 展 中 的 早期 特征 是 后 期 特征 的 基础 ， 个 体 倾 
向 于 保持 行为 能 力 的 出 现 顺 序 与 发 展 顺序 一 致 
(Newman, 2016). 从 这 个 逻辑 出 发 , 原音 由 强大 内 
生动 机 激发 .在 婴儿 出 生 不 久 后 即 产 生 (Long et al., 


2022), 其 出 现 的 言语 特征 可 以 为 后 期 的 言语 发 展 
提供 基础 。 
311 ”类 言语 发 声 为 早期 词汇 提供 了 语音 基础 


首先 ， 最 早期 的 类 言语 发 声 ( 如 准 元 音 ) 大 多 
是 在 婴儿 独自 探索 游戏 中 产生 的 、 具 有 很 强 的 内 
源 性 ， 是 深层 的 自然 选择 的 结果 (Long et al., 
2020); 早期 发 声 是 后 续 发 声 的 基础 ,没有 这 个 基 
础 ， 后 续 的 典范 音节 、 发 声 沟通 、 发 声 模仿 等 不 
可 能 产生 (Oller et al., 2019)。Oller 等 人 (2019) 的 研 
REM, 早产 了 2 个 月 的 婴儿 和 是 月 生产 婴儿 每 
分 钟 最 低产 生 1.4 个 原音 , 大 大 超过 了 婴儿 早期 
男 一 类 较 多 的 发 声 一 一 央 声 。 如 果 没 有 最 早期 的 
原音 , 成 人 与 婴儿 进行 发 声 互 动 的 基础 就 会 大 大 
减 小 。 因 为 相 比 较 非 类 言语 发 声 , 成 人 更 可 能 对 
婴儿 的 类 言语 发 声 进 行 回应 (Warlaumont et al., 
2014)。 

其 次 ， 典 范 音节 或 呀 呀 语 与 早期 词语 之 间 有 
很 强 的 语音 连续 性 ， 因 为 自然 语言 的 词语 绝 大 多 
数 是 由 典范 音节 构成 的 (Oller et al., 2019). 呀 呀 语 
音节 与 早期 词语 音节 有 相似 的 辅音 和 元 音 的 组 合 ， 
比如 舌尖 辅音 (coronal consonant) 与 前 元 音 (front 
vowel) 组 合 (Lahrouchi & Kern, 2018)。 前 10 个 词 
语 的 辅音 约 有 50%~80% 与 类 言语 发 声 中 的 辅音 
相同 (Keren-Portnoy et al.，2009)。 层 辅音 (labial 


consonant), TRAE ARAE (dorsal consonant) 


的 语 境 中 发 出 具有 多 种 情感 意义 的 发 声 (Oller 
et al., 2013). Oller 等 人 (2013) 发 现 3~4 个 月 婴儿 
类 言语 发 声 情感 功能 比 非 类 言语 发 声 ( 如 问 声 和 
笑 声 ) 具 有 更 强 的 灵活 性 。 婴 儿 的 类 言语 发 声 可 以 
表现 出 积极 的 、 中 性 的 和 消极 的 情感 功能 ， 而 回 
声 或 笑 声 功 能 较为 僵化 只 能 表现 出 消极 的 或 积极 
的 情感 功能 。 进 一 步 研究 发 现 ， 类 言语 发 声 的 功 
能 灵活 性 在 1 个 月 婴儿 中 即 可 出 现 (Jhang & Oller, 
2017)。 因 此 ， 婴 儿 类 言语 发 声 表 现 出 的 功能 灵活 
性 可 能 是 语言 发 展 的 关键 一 步 。 
3.2 ”类 言语 发 声 创造 了 婴 幼 儿 的 学 习 状 态 

第 二 种 机 制 强 调 类 言语 发 声 对 婴 幼 儿 自 身 语 
言 学 习 状 态 的 影响 ， 即 婴 幼 儿 的 类 言语 发 声 可 能 
帮助 他 们 创造 有 利于 语言 学 习 的 有 效 状 态 并 示意 
给 他 人 。 这 一 有 效 状 态 涉 及 到 注意 力 的 集中 、 有 
效 的 语音 感知 和 高 动机 的 社交 状态 。 


3.2.1 ”类 言语 发 声 标 志 着 婴 幼儿 有 利于 学 习 的 注 


物体 指向 发 声 (Object-Directed Vocalizations, 
ODV) 是 指 婴 儿 看 着 近 处 或 手 上 的 物体 时 发 出 的 
声音 。ODYV 表明 婴儿 处 于 注意 力 集中 状态 ， 有 助 
于 婴儿 学 习 物 体 的 特征 及 物体 与 对 应 符号 之 间 的 
联系 (Goldstein et al., 2010)。Goldstein 等 人 (2010) 
采用 实验 研究 验证 了 这 一 机 制 。 实 验 1 包括 物体 
探索 测试 和 优先 注视 任务 (preferential looking 
task) 两 个 阶段 。 首 先 , 通过 物体 探索 测试 辨别 出 
12 个 月 大 婴儿 的 高 发 声 物体 和 低 发 声 物体 。 然后， 
在 优先 注视 任务 阶段 ， 配 对 呈现 高 发 声 物 体 或 低 
发 声 物 体 的 原始 版 本 和 形状 扭曲 版 本 ， 观 测 婴 儿 
注视 物体 的 时 间 。 这 一 操控 的 逻辑 是 ， 婴儿 习 得 
了 更 多 的 高 发 声 物体 的 视觉 特征 ， 在 高 发 声 物体 
的 原始 版 本 与 形状 扭曲 版 本 同时 呈现 时 ， 婴儿 更 


的 分 布 在 呀 呀 语 和 最 初 的 100 个 词语 之 间 无 显著 
差异 (van der Feest et al., 2020)。 因 此 ， 词 语 学 习 的 
最 初 阶段 ， 表 达 性 词汇 量 小 于 100 时 ,婴儿 词语 
习 得 更 符合 语音 优势 假说 (phonological dominance 
hypothesis)， 即 词语 习 得 更 依赖 发 音 系统 (articulatory 
system) 和 语音 产生 能 力 。 
3.1.2 ”类 言语 发 声 为 语言 提供 功能 灵活 性 基础 
功能 灵活 性 是 指使 用 任何 词语 或 句子 在 不 同 
场合 表达 不 同 的 情感 ， 是 语言 沟通 所 必需 的 ， 也 
是 语言 的 基础 属性 (Jhang & Oller, 2017)。 婴 儿 的 


首 好 形状 扭曲 版 本 的 物体 ， 对 其 注视 的 时 间 更 
长 。 结 果 表 明 ， 婴 儿 对 高 发 声 物 体 的 新 异 版 本 注 
视 时 间 更 长 、 特 征 了 解 更 多 。 这 支持 了 ODV 标志 
着 婴儿 集中 注意 力 和 可 能 对 发 声 后 的 知觉 信息 特 
别 敏 感 的 观点 。 实 验 2 进一步 将 ODV 创造 的 注意 
力 状态 与 语言 学 习 进行 关联 ， 相 比较 没有 发 声 ， 
婴儿 在 ODV 之 后 更 有 可 能 将 语言 符号 与 物体 联系 。 
3.2.2 ”类 言语 发 声 显 示 了 婴 幼儿 良好 的 语音 感知 
的 状态 
类 言语 发 声 有 利于 婴儿 感知 语音 流 中 的 语音 
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类 别 。 熟练 发 出 的 呀 呀 语 可 以 作为 一 种 感知 的 “过 
滤器 ”(filter), 将 婴儿 的 注意 力 吸引 到 与 他 们 可 靠 
地 发 出 的 声音 相 匹 配 的 词语 上 (Laing & Bergelson, 
2020)。Vilain 等 人 (2019) 采 用 感觉 间 匹 配 程序 
(intersensory matching procedure) 探 索 6 个 月 和 9 
个 月 婴儿 呀 呀 语 产生 能 力 对 辅音 感知 的 影响 。 研 
FE BIN, 与 不 具备 呀 呀 语 产生 能 力 的 婴儿 相 比 ， 
稳定 产生 呀 呀 语 的 且 能 连续 重复 产生 辅音 /b/ 和 /d/ 
的 婴儿 能 够 将 含有 以 上 两 个 辅音 的 语音 与 视觉 信 
息 相 匹配 。 当 听觉 辅 音 材料 换 成 这 两 个 年 龄 段 婴 
儿 都 未 产生 的 /w/ 和 /z 时 ， 两 组 婴儿 都 不 能 完成 感 
觉 间 匹配 任务 。 

进一步 的 研究 表明 ， 随 着 年 龄 的 增长 ， 具备 
更 强 类 言语 发 声 能 力 的 婴儿 更 可 能 对 较 难 发 音 的 
BE BET RA, Lorenzini 和 Nazzi (2020) 采 用 转 
头 偏好 程序 (head-turn preference procedure) 探 索 
了 USAR 14 个 月 婴儿 对 包含 不 同 发 音 难度 的 
崩 音 且 熟 悉 的 词语 的 感知 。 他 们 将 两 个 年 龄 段 的 
婴儿 按照 已 具备 的 辅音 能 力 分 为 高 辅音 能 力 组 和 
低 辅 音 能 力 组 。 研 究 发 现 ，11 个 月 高 辅音 能 力 婴 
儿 对 词语 的 感知 时 间 更 长 , 但 并 未 发 现 辅音 发 音 
难度 有 显著 影响 。 然 而 ，14 个 月 高 辅音 能 力 婴 儿 
对 包含 发 音 难度 较 高 辅音 的 词语 感知 时 间 更 长 。 
综 上 ,婴儿 具备 的 类 言语 发 声 有 助 于 他 们 对 语音 
的 感知 进而 促进 语言 学 习 。 
3.2.3 ”类 言语 发 声 体 现 了 婴 幼 儿 主 动 参与 社交 互 

动 的 动机 

婴儿 发 现 他 们 可 以 影响 他 人 的 行为 而 不 是 被 
动 的 参与 ， 对 语言 习 得 是 至 关 重 要 的 ,婴儿 在 2~5 
个 月 期 间 学 习 类 言语 发 声 的 社会 功能 ,在 静止 面 
孔 任 务 (still-face task) 中 ,5 个 月 大 婴儿 增加 类 言 
语 发 声 以 期 待 静止 面孔 的 成 人 对 他 们 的 发 声 做 出 
回应 。 这 表明 ， 此 时 婴儿 能 有 意识 地 采用 类 言语 
发 声 去 影响 成 人 (Bigelow et al., 2018; Elmlinger, 


们 发 声 沟通 行为 时 ,能 产生 更 多 发 声 影响 母亲 行 
为 的 婴儿 在 15 个 月 时 语言 能 力 更 好 ， 即 意识 到 发 
声 的 社会 影响 的 婴儿 在 语言 发 展 方面 处 于 优势 地 
位 。 
3.3 ”类 言语 发 声 诱发 了 社会 的 回应 行为 

第 三 种 机 制 强调 类 言语 发 声 的 社会 功能 ， 即 
婴儿 通过 类 言语 发 声 有 意 或 无 意 地 诱发 了 社会 伙 
伴 的 回应 行为 并 创造 了 社会 互动 , 从 而 有 助 于 他 
们 的 语言 发 展 (Albert et al., 2018; Cohen & Billard, 
2018; Donnellan et al., 2020)。 自 由 游戏 中 社会 伙 
伴 对 大 约 40%~70% 的 婴儿 类 言语 发 声 进 行 回应 
(如 Athari et al., 2021; Gros-Louis et al., 2006; 
Lieberman et al.，2019)， 且 言语 回应 明显 高 于 非 
言语 回应 (Gros-Louis & Miller, 2018)。 社会 回应 行 
为 的 后 效 性 、 引 导 性 、 鹰 架 性 等 特征 增加 了 婴儿 
成 功 学 习 语言 的 几率 (Tamis-LeMonda et al., 2014)。 
3.3.1 ”社会 回应 行为 提供 了 后 效 性 支持 

社会 伙伴 (主要 是 照顾 者 ) 的 后 效 回应 
(contingent response) 与 婴儿 类 言语 发 声 存 在 依赖 
关系 或 时 间 上 的 连续 性 (如 Fagan & Doveikis, 
2017; Gros-Louis & Miller, 2018)。 首 先 ,社会 伙伴 
的 后 效 回应 是 依赖 于 婴儿 先前 的 类 言语 发 声 。 如 
婴儿 玩 球 的 时 候 发 声 “"ba”， 母 亲 说 “ball]” 对 婴儿 的 
发 声 进行 回应 。 这 种 依赖 关系 有 可 能 增加 婴儿 听 
到 最 突出 物体 和 事件 相应 词语 的 几率 ， 从 而 促进 
统计 学 习 (Tamis-LeMonda et al., 2014)。 其 次 ， 母 
亲 对 婴儿 发 声 的 回应 大 多 发 生 在 2 WA, 几乎 所 
有 的 回应 都 发 生 在 3 秒 内 (Pretzer et al., 2019; van 
Egeren et al., 2001; Yoo et al., 2018)。 这 种 紧密 的 
时 间 联 系 对 婴儿 的 语言 发 展 至 关 重 要 ， 因 为 两 个 
事件 联系 在 一 起 的 可 能 性 取决 于 它们 在 很 短 的 时 
间 窗 口内 同时 发 生 (Rovee-Collier 1995)。 后 效 回 
应 加 强 了 婴儿 的 注意 力 , 使 得 婴儿 对 照顾 者 参与 
操作 的 物体 表现 出 强烈 的 偏好 ， 让 婴儿 更 好 地 从 


Schwade et al., 2022)。 认 识 到 类 言语 发 声 在 引发 
回应 方面 的 有 效 性 ， 即 婴儿 用 发 声 主动 引导 互 
动 、 让 照顾 者 回应 行为 的 能 力 ， 是 迈 向 语言 沟通 
的 重要 一 步 (Wu & Gros-Louis, 2017). Wu 和 Gros- 
Louis (2017) 测 试 10 个 月 大 婴儿 在 3 种 条 件 下 ( 母 
亲 回 应 婴儿 沟通 行为 并 与 婴儿 分 享 对 玩具 的 注意 
和 兴趣 、 母 亲 只 对 婴儿 沟通 行为 作出 回应 不 注意 
玩具 、 母 亲 忽 视 婴 儿 沟 通行 为 ) 的 发 声 与 15 个 月 
时 的 语言 能 力 的 关系 。 结 果 表 明 , 在 母亲 忽视 他 


儿 向 语 (infant-directed speech) 中 学 习 (Masek et al., 
2021; Mason et al.，2019)。 事 件 相 关 电 位 (event- 
related potential) 人 研究 初步 显示 ,与 非 后 效 性 言语 
回应 相 比 ， 婴 儿 对 照顾 者 后 效 言语 回应 产生 了 注 
意 并 有 可 能 进行 了 词汇 语义 加 工 (Lam-Cassettari 
et al., 2021)。 

社会 伙伴 的 后 效 回 应 有 利于 婴儿 的 语音 和 词 
汇 发 展 得 到 了 证 实 。 实 验 研 究 表明 ,与 非 后 效 言 
语 回应 相 比 ， 母 亲 对 9.5 个 月 婴儿 的 类 言语 发 声 
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进行 后 效 回应 后 ， 婴 儿 的 类 言语 发 声 融 人 了 母亲 
的 语音 模式 (Goldstein & Schwade, 2008)。 对 12 个 
月 大 婴儿 的 观察 研究 表明 ， 与 未 进行 后 效 回应 相 
比 ， 照 顾 者 后 效 回 应 婴儿 的 CV 发 声 后 ， 婴 儿 产 
生 了 更 多 的 CV 音节 ; 对 婴儿 的 V 发 声 进 行 后 效 
应 后 ， 婴 儿 V 音节 产生 减少 (Gros-Louis & 
Miller, 2018)。 这 说 明 婴 儿 发 声 与 成 人 后 效 回应 的 
反馈 循环 可 以 帮助 婴儿 产生 更 高 级 的 声音 ,进而 
产生 第 一 批 词语 中 更 复杂 的 语音 模式 。ASD 儿童 
的 研究 也 表明 ,父母 的 后 效 语言 回应 预测 了 ASD 
儿童 的 表达 性 词汇 量 (McDaniel et al., 2017)。 
33.2 ”社会 回应 行为 包含 了 引导 性 信息 

当 照 顾 者 回应 婴儿 的 类 言语 发 声 时 ,引导 性 
信息 一 般 体现 在 他 们 使 用 物体 名 称 、 描 述 和 询问 
物体 或 事件 等 语言 上 (Tamis-LeMonda et al., 
2014)。 对 8~14 个 月 婴儿 的 观察 和 实验 研究 表明 ， 
相 比 较 信 息 量 较 少 的 言语 回应 (如 与 婴儿 所 处 环 
境 不 相关 的 陈述 、 肯 定 或 禁止 婴儿 的 行为 等 )， 母 
亲 对 婴儿 类 言语 发 声 提 供 更 多 的 包含 引导 性 信息 
的 言语 回应 (如 命名 婴儿 关注 物体 、 描 述 婴 儿 的 状 
态 或 婴儿 关注 的 物体 、 提 问 婴 儿 关 注 物 体 信 息 等 ) 
(Albert et al., 2018; Fagan & Doveikis, 2019; Hong & 
Gros-Louis, 2017)。 与 信息 较 少 的 回应 相 比 ， 照 顾 者 
包含 引导 性 信息 的 言语 回应 与 婴儿 当下 的 理解 性 
和 表达 性 词汇 量 相关 (Lopez et al., 2020) 或 预测 婴儿 
未 来 的 表达 性 词汇 量 (Goldstein & Schwade, 2010)。 

进一步 分 析 发 现 , 在 照顾 者 包含 引导 性 信息 
回应 中 , 对 婴儿 ODV 类 言语 发 声 的 回应 显著 多 于 
JE ODV 类 言语 发 声 (Albert, 2021; Albert et al., 
2018)， 且 婴儿 ODV 发 声明 显 多 于 朝向 成 人 发 声 
和 无 具体 朝向 的 发 声 (Hong & Gros-Louis, 2017)。 
关于 母亲 对 9 个 月 婴儿 ODYV 类 言语 发 声 的 言语 回 
应 对 婴儿 15 个 月 时 词汇 量 预测 的 研究 表明 ,包含 
婴儿 关注 物体 名 称 的 言语 回应 显著 预测 了 婴儿 后 
期 的 表达 性 词汇 量 (Goldstein & Schwade, 2010)。 
也 就 是 说 , 通过 提供 物体 名 称 来 回应 婴儿 ODV 类 
言语 发 声 的 母亲 可 能 会 帮助 婴儿 识别 发 声 和 环境 
中 物体 之 间 的 联系 ,从 而 促进 词语 学 习 。 
3.3.3 ”社会 回应 行为 提供 了 鹰 架 性 支持 

社会 伙伴 的 回应 行为 与 婴儿 的 发 展 水 平 相 协 
VASP A LI S AZ BE AE ME SR (scaffolding), JL 


2019，August)， 照 顾 者 对 婴儿 类 言语 发 声 后 效 回 
应 的 语言 结构 与 婴儿 指向 但 非 后 效 回应 的 语言 相 
比 具 有 较 少 的 词语 类 型 (Elmlinger et al., 2021), 
有 具体 表现 为 照顾 者 说 出 不 同 的 词语 更 少 、 每 个 话 
语 的 词语 更 少 、 只 包含 单个 词语 的 话语 比例 更 高 
(Elmlinger, Goldstein et al., 2022, July; Elmlinger, 
Schwade & Goldstein，2019) 和 更 多 的 重复 词语 
(Elmlinger et al., 2021)。 母亲 在 婴儿 7 个 月 时 语言 
输入 的 重复 性 特征 预测 24 个 月 时 的 表达 性 词汇 
量 (Newman et al., 2016); 与 连续 句子 中 有 不 同 目 
标 词语 相 比 , 2 岁 幼 儿 在 连续 句子 中 重复 出 现 目标 
词语 条 件 下 更 容易 习 得 目标 词 (Schwab & 
Lew-Williams, 2016); 幼儿 21 个 月 时 母亲 的 重复 
话语 预测 30 个 月 时 的 词汇 量 (Casla et al., 2022)。 
日 此 可 见 ， 婴 儿 类 言语 发 声 引起 了 成 人 的 简化 语 
， 进 而 促进 了 婴 幼 儿 语 言 的 学 习 。 

已 有 关于 类 言语 发 声 可 能 有 利于 语言 发 展 机 
制 的 研究 ,加 深 了 类 言语 发 声 为 什么 能 促进 语言 
发 展 的 理解 。 但 大 多 数 研究 是 对 婴儿 类 言语 发 声 
或 社会 回应 的 单方 面 探 讨 ， 涉 及 两 者 之 间 动 态 交 
互 的 研究 也 集中 在 探讨 婴儿 类 言语 发 声 的 语音 如 
何 随 着 社会 性 回应 而 变 得 更 加 成 熟 , 未 来 可 尝试 
开展 更 深层 次 的 动态 交互 研究 。 


4 未 来 研究 方向 


41 探索 类 言语 发 声 与 语言 发 展 的 因果 关系 

由 上 文 的 综述 可 知 ， 已 有 研究 发 现 婴 幼儿 早 
期 的 类 言语 发 声 和 随后 的 语言 发 展 之 间 的 相关 ， 
然而 缺乏 实验 研究 来 验证 两 者 的 因果 关系 。 第 一 ， 
未 来 的 研究 可 通过 实验 的 方法 ， 以 类 言语 发 声 向 
第 一 批 词语 过 渡 期 的 婴儿 为 研究 对 象 ， 操 控 社交 
的 后 效 回应 方式 ， 以 探讨 婴儿 类 言语 发 声 与 词语 
学 习 的 关系 。 近 期 有 研究 开始 尝试 操控 父母 的 后 
效 回 应 对 婴儿 发 声 及 表达 性 词汇 的 影响 。 父 母 产 
生 更 多 儿 向 语 、 与 孩子 有 更 多 交互 互动 的 实验 组 
比 控制 组 婴儿 表现 出 更 多 的 呀 呀 语 和 表达 性 词汇 
(Ferjan Ramirez et al., 2019)。 然 而 ， 该 研究 并 未 操 
控 父 母 只 回应 婴儿 的 类 言语 发 声 ， 更 未 区 分 不 同 
类 型 的 类 言语 发 声 。 如 前 文 所 述 , 不 同类 言语 发 
声 对 语言 的 影响 不 同 , 将 来 有 必要 对 类 言语 发 声 
类 型 进行 控制 以 进一步 探究 。 第 二 , 通过 对 前 语 
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的 类 言语 发 声 有 助 于 照顾 者 说 出 更 简单 化 、 更 容 
易学 习 的 语言 (Elmlinger, Schwade & Goldstein, 


言 期 的 语言 障碍 儿童 进行 类 言语 发 声 的 干预 ， 以 
此 确定 类 言语 发 声 与 词语 学 习 的 因果 关系 。 
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42 ”相关 因素 对 类 言语 发 声 预测 语言 发 展 的 调 

前 文 关 于 不 同类 言语 发 声 对 语言 预测 的 结果 
表明 ， 部 分 指标 对 语言 发 展 预测 的 结果 并 不 一 致 
甚至 差异 较 大 。 其 原因 可 能 是 其 他 相关 因素 的 影 
响 ， 比 如 社交 沟通 障碍 的 严重 程度 在 一 定 程 度 上 
影响 ASD 儿童 未 来 的 语言 能 力 (Thurm et al., 
2015)。 社交 沟通 障碍 是 否 调 节 了 类 言语 发 声 与 语 
言 能 力 的 关系 ? 认 知 会 影响 语言 发 展 ， 其 与 语言 
能 力 可 能 从 婴儿 3 个 月 开始 就 存在 关联 (Perszyk 


性 语言 (Blume et al., 2021; McDaniel et al., 2018), 
但 却 未 分 析 哪 种 特定 类 言语 发 声 能 更 有 效 预测 表 
达 性 语言 。 正 如 前 文 所 述 ASD 儿童 的 眼神 接触 存 
在 障碍 , 那么 ASD 眼神 与 发 声 相 结合 的 沟通 行为 
可 能 也 会 相应 地 减少 。 协 调 眼 神 的 沟通 性 发 声 、 协 
调 手势 的 沟通 性 发 声 对 语言 的 预测 是 否 相 同 呢 ? 
对 ASD 儿童 来 说 ， 最 具有 预测 价值 的 发 声 沟通 行 
为 是 什么 呢 ? 将 来 可 以 对 这 些 问 题 进 一 步 探 究 。 
45 ”类 言语 发 声 与 社会 回应 的 动态 交互 

首先 , 探究 TD 儿童 的 类 言语 发 声 与 社会 回 


& Waxman, 2018)， 但 认 知 是 否 调节 类 言语 发 声 与 
语言 发 展 的 关系 尚 不 清晰 。 前 文 的 综述 发 现 TD 
婴儿 的 年 龄 可 能 会 影响 类 言语 发 声 与 语言 发 展 的 
KA, 大约 有 60% 的 ASD 儿童 在 5 岁 前 无 口语 或 
只 能 用 极 少数 的 词语 进行 沟通 (Maltman et al., 
2021), 大 约 有 30% 的 ASD 儿童 在 5 岁 及 以 后 仍 处 
于 口语 极度 受 限 的 状态 (Tager-Flusberg & Kasari, 
2013)。 年 龄 是 否 是 影响 ASD 儿童 类 言语 发 声 对 
语言 能 力 预 测 的 调节 因素 ? 未 来 的 研究 可 以 尝试 
探究 障碍 严重 程度 、 认 知 、 年 龄 等 相关 因素 对 类 
言语 发 声 与 语言 发 展 关 系 的 调节 作用 。 
4.3 ”语言 测试 方式 及 类 言语 发 声 指标 本 身 的 影响 
首先 ， 类 言语 发 声 对 表达 性 和 理解 性 语言 预 
测 的 不 一 致 可 能 是 由 于 语言 能 力 测试 方式 所 致 。 
未 来 可 以 控制 类 言语 发 声 指标 类 型 、 儿 童年 龄 与 
障碍 类 型 等 因素 , 采用 不 同 的 语言 测试 方式 , 探 
究 类 言语 发 声 是 否 能 一 致 预测 理解 性 与 表达 性 语 
言 。 其 次 ， 类 言语 发 声 指标 本 身 可 能 影响 其 与 语 
言 能 力 的 关系 。 如 典范 音节 比率 对 未 来 语言 发 展 
困难 预测 的 研究 表明 ,典范 音节 比率 为 0.14 和 0.15 
的 标准 有 相似 的 预测 敏感 度 , 但 特异 度 差异 较 大 。 
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应 的 动态 交互 。 有 研究 探讨 婴儿 类 言语 发 声 与 社 
会 回应 的 交互 对 婴儿 语音 的 影响 ,照顾 者 更 可 能 
对 婴儿 的 类 言语 发 声 回应 ,在 照顾 者 回应 后 婴儿 
的 发 声 更 成 熟 (Warlaumont et al., 2014)。 然 而 两 者 
关系 更 深层 面 的 动态 交互 尚 不 清晰 ， 如 在 社会 性 
后 效 回应 后 婴儿 的 注意 力 变 化 、 对 物体 加 工 的 变 
化 、 匹 配 成 人 回应 与 参照 物 关 系 的 变化 等 ; 照顾 
者 又 是 如 何 随 着 婴儿 类 言语 发 声 及 相关 行为 变化 
调整 自己 的 行为 ? 未 来 可 以 尝试 开展 此 方面 的 研 
BE, 尤其 是 纵向 探究 婴儿 的 发 声 发 展 及 社会 回应 
交互 的 变化 。 

其 次 , 探究 类 言语 发 声 障碍 与 社会 回应 的 动 
态 交互 。 大 量 研究 支持 ASD 、 言 语 失 用 、Rett 综 
征 等 儿童 的 类 言语 发 声 发 展 存在 延迟 或 异常 现 
象 (Bartl-Pokorny et al., 2022; Garrido et al., 2017; 
Overby et al., 2020; Roche et al., 2018; Yankowitz 
et al., 2022)。 然 而 ， 这 些 儿 童 的 类 言语 发 声 与 社会 
回应 的 动态 交互 却 不 清晰 。 近 期 一 项 针对 呀 呀 语 
发 展 延迟 婴儿 与 TD 婴儿 社会 后 效 的 研究 发 现 ， 
父母 对 两 类 婴儿 类 言语 发 声 的 回应 数量 无 显著 差 
异 ， 然 而 父母 对 呀 呀 语 发 展 延迟 婴儿 的 回应 更 多 
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这 说 明 典 范 音节 比率 的 标准 可 能 是 影响 类 言语 发 
声 对 语言 预测 的 因素 (Nyman et al., 2021)。 未 来 研 
究 也 可 尝试 探究 类 言语 发 声 指标 本 身 的 影响 。 
44 语言 障碍 儿童 语言 干预 中 最 具有 价值 的 类 

言语 发 声 

语言 障碍 儿童 的 长 期 康复 目标 之 一 是 提高 他 
们 的 语言 能 力 ， 而 对 最 能 影响 他 们 语言 能 力 的 类 
言语 发 声 开展 干预 则 是 实现 这 一 目标 的 重要 途 
径 。 由 上 文 可 知 , 不 同 的 类 言语 发 声 对 语言 发 展 
预测 的 效力 不 同 。 那 么 ,探究 对 不 同 障碍 类 型 儿 
童 最 具 预 测 价 值 的 类 言语 发 声 则 非常 重要 。 虽 有 
研究 探索 了 ASD 儿童 的 类 言语 发 声 能 预测 表达 


是 认可 (如 “是 的 ”), 对 TD 婴儿 的 回应 更 多 是 模仿 
或 扩展 他 们 的 发 声 (Lieberman et al., 2019)。 相 比 
较 母 亲 调 节 行 为 的 语言 (如 “看 这 ”“ 放 下 ”), TD 婴 
儿 对 母亲 信息 参照 的 语言 (如 ,“ 那 是 小 狗 ”) 发 声 回 
应 更 多 (Kuchirko et al., 2018)。 此 外 ， 照 顾 者 对 TD 
儿童 后 效 回 应 的 时 间 间 隔 和 TD 儿童 对 照顾 者 后 
效 回 应 的 时 间 间 隔 存在 显著 的 相关 ， 而 语言 发 育 
迟缓 幼儿 与 照顾 者 之 间 却 不 存在 这 种 关系 ; 9 个 月 
婴儿 与 照顾 者 之 间 的 协调 回应 的 平均 间隔 时 间 为 
2 秒 , 间隔 每 增加 1 个 单位 ，2~3 岁 时 语言 能 力 会 
降低 0.53 个 单位 (Northrup & Iverson, 2015)。 未 来 
可 以 进一步 探究 相关 语言 障碍 儿童 的 类 言语 发 声 
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是 如 何 影 响 后 效 回 应 ， 而 后 效 回应 又 是 如 何 影响 
他 们 的 类 言语 发 声 的 。 


S 小 结 


婴 幼 儿 类 言语 发 声 数量 或 频次 、 典 范 音 节 比 
例 或 频次 、 辅 音 多 样 性 与 沟通 性 发 声 预 示 着 语言 
的 发 展 。 关 于 类 言语 发 声 如 何 有 助 于 语言 发 展 存 
在 以 下 观点 : 类 言语 发 声 为 早期 词汇 提供 了 语音 
基础 、 为 语言 提供 功能 灵活 性 准备 ; 类 言语 发 声 
标志 着 婴 幼 儿 有 利 学 习 的 注意 力 状 态 、 语 音 感知 
状态 和 参与 社交 互动 的 动机 状态 ; 类 言语 发 声 诱 
发 了 社会 的 回应 , 后 者 提供 了 语言 发 展 的 后 效 性 
支持 、 引 导 性 信息 和 座 架 性 支持 。 未 来 的 研究 除 
了 探讨 类 言语 发 声 与 语言 发 展 的 因果 关系 ,语言 
障 但 儿童 语言 干预 中 最 具有 价值 的 类 言语 发 声 ， 
还 需要 着 重 研究 TD 儿童 和 语言 障碍 儿童 与 社会 
应 之 间 的 动态 交互 的 机 制 ， 以 为 类 言语 发 声 如 
可 向 语言 发 展 提供 更 深层 次 的 解释 。 研 究 结 果 将 
助 于 促进 TD 儿童 语言 发 展 及 相关 语言 障碍 儿 
童 的 干预 。 
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The predicting effect of speech-like vocalizations on language 
development in young children and its explanations 


LIU Min, LIU Qiaoyun, CHEN Siqi, XU Zhijia 
( East China Normal University Maternity and Infant Health Hospital, Shanghai 200062, China) 
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Abstract: Speech-like vocalizations are sounds that resemble adult speech and are the precursor for 
subsequent language development. Studies have shown that the frequency of speech-like vocalizations, 
canonical syllable ratio, consonant diversity, and communicative vocalizations in young children predict 
expressive language, but factors that predict receptive language development remain unclear. Additionally, 
findings investigating whether babble onset predicts word onset are also mixed. To a certain extent, the 
predictive relationship between speech-like vocalizations and language development can be explained by 
three mechanisms: speech-like vocalizations provide the basis for language production, speech-like 
vocalizations create an optimal learning state for language learning, and speech-like vocalizations promote 
social behavior. Future research may consider exploring the causal relationship between speech-like 
vocalizations and language development, moderating effects of related factors on speech-like vocalizations 
in predicting language development, uniquely valuable speech-like vocalizations for children with language 
disorders, and the dynamic interaction between speech-like vocalizations and social responses. 
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